9. Régression et prévision

On considère dans cet exercice un couple de variable (X, Y) dont on dispose de 150 observations (xi, yi), i = 1, …, 150.

 

xi

yi

somme des observations

1503.11

1527.24

somme des carrés

15374.69

16312.51

somme des produits

15012.36

1) Les coefficients d’asymétrie et d’aplatissement sont les suivants :

 

xi

yi

asymétrie

0.19

0.60

aplatissement

3.21

3.53

Pour 150 observations les valeurs limites des coefficients d’asymétrie et d’aplatissement données par la table sont les suivantes :

– 0.464 < cas < 0.464

2.450 < cap < 3.650

La répartition de la variable X peut être considérée comme proche de la loi normale (ou « courbe en cloche ») compte tenu de son faible coefficient d’asymétrie et de la proximité de son coefficient d’aplatissement avec la valeur théorique 3 de la loi normale.

Le coefficient d’asymétrie de la variable Y est positif et supérieur à la valeur critique. Il montre l’existence de valeurs particulièrement grandes par rapport à la moyenne. Pour cette raison, la répartition de cette variable est différente de celle de la loi normale.

2) On obtient les résultats suivants :

mx = 10.02

my = 10.18

sx2 = 2.1

sy2 = 5.12

sx = 1.45

sy = 2.26

r(x,y) = -0.586

 

 

La taille du coefficient de corrélation est très largement supérieure en valeur absolue à la valeur critique 0.1398 donnée dans le chapitre 3. Lorsque il s’agit d’un coefficient de corrélation obtenu à la suite d’une régression linéaire, la normalité des variables n’est pas indispensable pour comparer ce coefficient à la valeur critique. On peut dire par conséquent que la régression linéaire apporte une information significative sur Y en fonction de la variable X.

3) La droite de régression a pour équation :

y » - 0,913 x + 1,03174

 

x = 10

y » – 8.098